良师益友 | 北大邓小铁:做科研是因为“不想浪费生命”
良师益友
“良师益友”是 RLChina 公众号的一个栏目,以采访的形式记录学者对科研工作的思考。
导读
本篇推文主要介绍对北京大学前沿计算研究中心邓小铁教授的采访,按照实验室介绍、个人经历、学术见解、福利时间分为 4 个部分,共计 13 个问答。点击下方阅读原文,可跳转至 Bilibili 观看!
人物简介
邓小铁
● 北京大学前沿计算研究中心教授,欧洲科学院外籍院士,ACM Fellow,IEEE Fellow。1989 年于斯坦福大学获得博士学位,先后担任中国科学院系统科学研究所助理研究员和加拿大约克大学计算机科学与工程系助理教授。作为项目负责人,邓小铁教授曾承担加拿大、香港、英国,及国家基金委等十几项科研项目,并在多种国际期刊担任编委。他曾担任多个国际学术会议主席,并发起网络经济学国际三大洲(亚洲欧洲美洲)循环举办的全球性会议互联网及网络经济学术会议 The Conference on Web and Internet Economics (WINE)。他在算法博弈论方面及网络搜索的研究成果,被国际同行广泛引用,发表论文 200 余篇,被引用上万次;多次做国际学术会议特邀报告;曾获得 IEEE 理论计算机学术会议 FOCS 的最佳论文奖;其成果“关于图与组合优化的若⼲经典问题的研究”获 2015 年度⾼等学校科学研究优秀成果奖(自然科学)二等奖(排名第⼆)。应用方面获得多项美国专利及国家专利,曾担任重要互联网公司机制设计顾问。
● 主要科研方向为算法博弈论、互联网经济、在线算法、并行计算及区块链。近期的研究兴趣包括算法博弈论研究、均衡和机制设计、互联网广告系统、云计算定价及资源分配、社交网络行为分析及推荐系统,以及交通及物流网络算法。
采访视频
实 验 室
介 绍
1 能介绍一下您的实验室吗?
我们的实验室叫做博弈论实验室,现在主要的工作是机制设计、区块链、多智能体系这些方面,都是从博弈均衡、算法博弈论这种角度出发的,考虑环境中各方的优化、相互协调以及合作和竞争中均衡的实现。
个 人
经 历
2 您是 77 年恢复高考后的第一届考生,并考入了清华大学,关于这段经历您有什么难忘的回忆?
我们这一代人其实算是经历了国家最巨大的进步吧,在任何一个国家可能都很难看到这样的,几乎是从农业社会到先进技术开始被国外卡压地步(的进步)。那么对于个人来讲,高考确实是我人生中最重要的一个起点,假如没有这件事情的话,可能一切都会不同。因为很多情况下不同机会对最后结局不会有太大的影响,但是高考确实是人生最容易发生转变的转折点。
图 1 班级颐和园合影(第四排左四)
在清华读书的日子当然挺难忘的,其实我们这一代都挺珍惜这个机会的,那个时期有一个特点,大家都是全心全意努力学习。所以我们当时有一张照片——我没在里面,但是我们班同学在里面的,大概是关于当年高考的报道里面出现最多的一个照片——是我们班在阶梯教室上课,前面最清晰的就是我们同学,然后我可能在某个角落里面(笑)。
我那时候每天早上起来就在背英语,我好像语言能力比较差,所以在那方面特别努力,学习也是挺认真的。所以说整个生活想起来是挺难忘的,但也很容易忘记,因为每天都很一致。
图 2 西阶听课
3 如何看待社会对高考的态度?您觉得现在的高考制度合理吗?哪里可以改进?
我们当时的情况下,我觉得高考——也就是唯分数论的考试制度——这件事情是给了国家进步的一个人力资源基础,让各方面的科技人才在那段时间里都能成长起来,在录取上面还是起到了挺大的作用的。而且(高考)至少判别标准简洁,当时也是刚刚改革开放起来之后,每件事情大家都有不同的想法,但是对于高考录取这件事情有一个社会共识,这就挺好的,至少在那个时期。
那么到现在来讲,回过来看,这种单一的模式也许确实对我们在某些方面不是特别合适,有些我们觉得重要的领域可能慢慢的消失了。所以我觉得很重要一点,我们要保留人才的多样性,让各种方面的人才都能成长起来。我们要能够去保证各个大学独特的风格和特长,有一些更加有多样性的专业评判原则,不会说某些方面的人才根本就找不着了。这是我自己的感觉吧。
4 您是怎样决定走上科研道路的呢?
5 您证明了两人博弈纳什均衡解的算法复杂度是 PPAD 的,您能讲讲那时候的故事吗?比如启发您的契机,以及遇到的困难和解决方法。
这个当时也是整个计算理论界里一个长久追求的问题。当时就是说从数学上,均衡计算最著名的就是不动点方法,市场均衡当初也是 Arrow 从不动点方法得到的一个最广泛的证明结果,Nash 和 Arrow 也都分别因为这两个结果得到了诺贝尔奖。那么 PPAD 呢,是建立在纳什均衡的一个叫做 Lemke-howson 的解法的结构上的计算等价类。以前的分析都是想建立起来 PPAD 跟均衡、PPAD 跟不动点(的联系),但这两个直接的连接都有点困难。一个原因就是(均衡和不动点)这两个都是连续的问题,比如说 Lemke-howson 是对均衡的求解方案,不动点也可以这样求,但是它的不动点模型还是一个连续的模型。正好 2000 年左右的时候,有个日本人提出了一个用离散连续函数来定义不动点的方法,然后我和陈汐同学就开始对不动点的算法进行了一系列的研究,包括 oracle 模型和逻辑线路模型都做了研究。那么到此就是为 Two-Nash 的 PPAD 建立了离散不动点的基础。然后 Nash 均衡跟 PPAD 的联系是另外有一个希腊人,就是我导师和我的师弟,建了一些联系,但是进一步的推动其实是在离散不动点上。那么我们后来主要的工作就是通过这两个联系推动了这件事情的最终证明。我们后面也借助不动点在比如说 mobius band 这种 non-orientable 的空间里面的概念,推动了另外一些概念——PPA 的研究范式。所以这里的工作其实是一个挺长期的思路,最后把这个东西打开了以后进展就非常快。
学 术
见 解
6 多智能体强化学习和传统的博弈论有什么关系,是否可以互相借鉴?
7 纳什均衡作为多智能体博弈的解有何优势和缺点?是否有更好的方式来衡量策略的优劣?
8 您觉得数字化货币发展进程中,有哪些风险和机遇,计算机科学在其中又面临着哪些挑战?
9 能从博弈论的角度来谈一谈内卷到底指的是什么?您是怎么看待这个问题的?
10 您是如何处理好各种科研、教学和事务性工作的?您的科研动力是什么?
图 3 邓老师和同学们一起去长城郊游
然后(内因的话)我们这个领域——计算机科学、人工智能,对科学进步的各种可能性推动非常大。比如博弈论这个角度上,我刚才提到的纳什均衡是人类挺难应对的一个情况,在竞争环境中想做到合作博弈是非常不容易的。那么这里我们说通过计算机的帮助,能不能做到有更好的方法,能够替代纳什均衡个体优化的机制设计。就单对这一个问题,我觉得我们人工智能领域来说是挺大的挑战。
图 4 邓老师在长城处理工作
11 您曾在多地和多国学习和任教,您觉得中外顶尖大学和科研机构有哪些可以互相借鉴的地方?
也有点太多(笑)。
在清华的时候就比较简洁,你讲内卷,那么当时也是一个挺内卷的感觉。我们每个同学都是每天早上起来努力学习,晚上也是努力学习,各种努力学习。那时候刚进去的时候也都是挺害怕的,见一个人觉得他比我厉害。我当时总结出来一个经验,就是只要你旁边一个人在某个地方达到你的 60% 的时候你就开始害怕。那么就是人人恐慌,因为也有可能你在另外一个方面达到另外那个人的 60%,他也会害怕你,就相互害怕(笑)。
科学院当时也挺好的,我们老师带我们到处去开会、交流。我后来数一数,去了 5 个地方,都是讲习班,要么老师去讲习,要么去听老外的讲习,然后也认识了挺多比较有名的老外。想想特别感谢我们老师,我们那时候科研经费挺少,但是老师也拿出来给我们花,让我们跟他一起出去做这些交流。
在斯坦福的时候就有点反过来了,基本上和老师一个学期见一次面(笑)。老师会给很多问题给你做,总有一个可以做出来,这样子也挺好的。老师讲课也挺神奇的,每次老师讲课快讲完时候你就感觉这个问题很有意义,我们很快就可以把它用上去,然后最后5分钟他开始讲证明,“if…”然后“Only if…”,把粉笔丢一丢,一下就过去了(笑)。然后老师布置阅读很多——当时是研究生课嘛,新的科研题目在那上面读的挺多。最后我觉得美国的教育跟其他地方教育有一点特别不同的地方,就是它因为有很多外国人去,就安排大家把几乎所有的专业课都重学一遍,有一个共同的基础,以后大家合作啊这些都能够建立起来。
然后在加拿大那边教学了一点时间,当时我的朋友讲你不要备课,说如果你都忘了,你教给学生有什么用是吧。他们是这个教法。
后来到英国利物浦。英国因为是人口规模小的国家,所以有一个特点就是在国内评估的时候,你跟外面国家合作的论文排序不管排到哪都算你的,但你跟同事合作的要一人分一半,就是鼓励你的国际合作,产生它的国际影响力。然后每个学校有不同——我们国家就是太同质化,前面你问内卷的时候,其实我应该这么回答。英国的大学就是说每个大学都要评你是不是世界第一或者是国内第一,那么每个大学做的东西就不一样了。最后要评估的时候,学校会全国招人把人换掉,比如这个领域我们发展的不错,就让不是这个领域的人申请其他学校,把英国其他学校人招到我们学校来。所以他每个大学能够活下来都有一个强的方向,其实这种思路挺成功的。现在也看到我们国家开始也有些改变,有些是综合一流大学,有些是专科一流。那么我觉得专科一流不应该鼓励他们发展成全科的一流,你下一次发展成全世界第一或者全世界前三,其实也是挺好的一个思路。
北大我觉得我们的同事、同学是最好的,大家都很努力,学生也很努力,然后整个管理方面也比较人性化。在北大挺觉得荣耀的就一件事是,比如有一些讨论的时候,看见我们老师可以说出来他什么地方做得好、哪件事做得好、哪个领域做得好、哪个问题做得好。在国内有一个缺点,就是我们总看他有多少 paper、在哪个领域有 paper,然后这个领域排到前百分之多少。但百分之多少全世界太多了是吧,那么这个百分之多少有时候其实不代表太多的意义。
12 可以介绍一下北大“图灵班”的同学有什么特点,其日常生活是如何安排的吗?
我觉得图灵班是挺成熟的,当然也是从卷开始(笑)。像图灵班是优中选优,所以我一开始给他们上课的时候也是准备的要求很高的课程。其实想,想卷也不是今天开始的,我们那时候考研究生的时候,他们也讲说你们这一届应该是最好的学生,然后考试题就卷得不得了,一个老师出一道题,每个老师出一道最难的。那么图灵班刚开始也是挺卷的,对同学的要求特别高,但这件事情就是作用力等于反作用力,当时自己也挺累的(笑)。
现在好了,图灵班同学成长起来了,下一班的同学就可以用上一班的同学做助教。而且学生教学生其实是最好的方案,我大学的时候就这么觉得,因为老师有时候跟同学距离有点远,不知道学生学过什么,什么都得重新开始,同学不一样,高一年级的同学之前上的课基本上跟下一年的差不多,就特别有帮助,学生也成长的挺快的。
我们也组织活动,一起出去郊游什么的也都挺多的。北大学生很优秀的不光是学习,是各方面,所以他们组织的活动也挺开心的。但是确实卷这件事情在这里很糟糕,有些时候也是希望老师帮一帮他们,家长也多给他们一些正面的鼓励,这样就会少卷一下。
福 利
时 间
13 您在选择研究生时,会青睐具有怎样特质的学生呢?
我对我们的研究生其实挺希望的一件事就是,你要发现你的优点,然后发挥你的优点。当然一个基本态度是“不要浪费生命”,但是你的优点跟别人的优点不一样,就是不要太卷。其实比如北大的学生来讲,每一个人做什么事情都会挺成功的,别人早进步一点、你晚进步一点不是太重要的东西。比如我跟博士生也说,最后你的学术生涯最重要的东西就是你的博士论文,不是这门考试比别人少一分。
招研究生的特质的话,肯定是相信自己,自信心是最重要的。然后是选择你最喜欢的专业。去发现自己的才能,在你自己才能方面发展起来。
最后建议方面有一点思路是,关于国内国外这件事,总体来看我们的国家这么多年发展那么出色,你像外国都觉得我们进步太快,因为这个理由要限制我们。所以我们同学就不要想太多,尽量去做最合适的工作,最好的成长起来,什么事情都不会难倒你们。
视频:黄裔童,李阳
文字:王梓薏
编辑:田政,鲁云龙,王宁宇,吴晓艺,张海峰
关于我们
RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。我们将在微信公众号发布论文解读、学术动态、名家观点等,欢迎大家关注我们!
我们还在 Bilibili 平台发布最新的讲座回放等视频资料,欢迎扫码观看!